iT邦幫忙

2025 iThome 鐵人賽

DAY 25
0
AI & Data

AI初學者入門系列 第 25

Day25 CRAG (Corrective Retrieval-Augmented Generation )

  • 分享至 

  • xImage
  •  

一. 背景

在傳統的檢索增強生成(RAG)中,模型往往「檢索即用」:檢索到的文件直接交給模型生成答案。這種方式雖然方便,卻容易被錯誤資訊誤導。CRAG(Corrective RAG) 則提出另一種思路「檢索後修正」: 在生成之前,先對檢索結果進行過濾、檢查、驗證,讓模型輸出的內容更可靠。

二、CRAG 的概念

CRAG 比起RAG,插入了 Correction Layer。
其主要思路包含三個步驟:

  1. 檢索(Retrieve)
    與傳統 RAG 相同,先從向量資料庫中檢索出候選文件(Top-K)。
  2. 修正(Correct)
    引入 過濾與驗證模組:使用 LLM 或輕量模型判斷檢索結果是否相關。
    移除低相關或有誤導性的文件。
  3. 生成(Generate)
    將經過修正過的文件餵給 LLM,生成更可靠的回應。

三、技術細節

  1. Correction Layer 的設計
  • 過濾式 Correction
    使用判斷模型(如 cross-encoder, 微調 LLM)的文件相似度,去除無關資訊。
  • 一致性檢查(Consistency Check)
    讓 LLM 自問自答:比較不同文件之間是否矛盾
  • 事實驗證(Fact-Verification)
    將候選文件中的關鍵陳述丟到外部知識並做二次檢查。
  1. 融合策略
  • Weighted Fusion:對文件設定信任分數(Trust Score)
  • Contrastive Decoding:在生成時同時考慮正樣本(可信文件)與反樣本(不可信文件),降低幻覺。
  • 多代理協作(例如 Agentic Workflow)
    例如:Agent A 負責檢索、Agent B 負責糾錯、Agent C 負責最終生成

四、挑戰

  1. 成本問題
    Correction Layer 要額外推理,需增加成本
  2. 糾錯的可靠性
    若 Correction Layer 本身判斷錯誤,可能反而丟掉正確文件。

上一篇
Day24 HyDE(Hypothetical Document Embeddings)
下一篇
Day26 介紹MCP (Model Context Protocol)
系列文
AI初學者入門30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言